Qt hier 


第 65 卷 第 12 期 2021 年 6 月 
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fi 要: [目的 /意义 ] 药物 组 合 相 比 单一 药物 在 临床 治疗 中 存在 多 种 优势 ,但 药物 数量 的 快速 增长 为 药物 组 合 筛选 和 推荐 
带 来 挑战 ,因此 设计 有 效 的 预测 方法 为 药物 研发 人 员 推 荐 更 易 产生 协同 作用 的 药物 组 合 从 而 提高 利 选 效率 具有 
重要 意义 。 [ 方法 “过程 ] 面向 疾病 并 发 症 诊 疗 需求 ,基于 链 路 预测 构建 协同 药物 组 合 推荐 模型 ,首先 利用 SAO 语 
义 挖 气 识别 医学 文献 中 的 并 发 症 信 息 ,在 此 基础 上 利用 医学 数据 库 构 建 “疾病 -药物 - 靶 点 " 异 质 网 络 ,并 引入 链 
路 预测 方法 对 网 络 进行 药物 作用 机 制 的 相似 性 评估 ,预测 哪些 药物 组 合 更 可 能 产生 协同 作用 ,进而 依据 预测 结果 
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LO 测 模 型 具有 有 效 性 和 实用 性 。 

ef SAO 语义 挖 气 ” 链 路 预测 ”社会 网 络 分 析 


ES: G250 
: 10.13266/j. issn. 0252 -3116.2021. 12.012 


药物 组 合 推 荐 


针对 菜 个 疾病 或 菜 对 并 发 症 进 行 药物 组 合 推 荐 。|[ 结果 /结论 ] 肠 道 疾病 数据 实证 分 析 结 果 表 明 协 同 药物 组 合 预 


老 药 新 用 是 目前 重要 的 制药 策略 之 一 ,科技 部 生 
心 强调 新 冠 肺炎 药物 的 研发 要 遵循 该 策略 , 因 其 
民 提 高 研发 效率 ,同时 可 以 保证 安全 性 ,而 利用 筛选 
试 又 研制 药物 组 合 是 其 中 一 种 主要 方向 。 协 同 药物 组 
含 揭 的 是 两 种 以 上 的 药物 合用 时 ,如 果 它 们 的 作用 方 
向 一 致 ,能 够 实现 彼此 增强 的 效果 , 即 组 合 总 效应 超过 


的 筛选 实验 ,但 随 着 单 药 数量 的 快速 增加 ,随机 组 合 数 
量 暴 增 ,筛选 效率 降低 ,因此 有 必要 开发 有 效 的 协同 药 
物 组合 推 荐 方法 为 筛选 试验 缩小 范围 从 而 提高 药物 组 
合 的 研发 效率 。 

目前 ,协同 药物 组 合 推荐 主要 基于 三 类 方法 :高 通 
量 筛 选 法 .基于 计算 的 预测 模型 和 基于 网 络 的 预测 模 
型 。 其 中 高 通 量 筛选 协同 药物 组 合 具 有 过 高 的 实验 要 
求 , 另 外 两 种 方法 则 随 着 数学 .计算 机 科学 和 生物 信息 


各 药 单 用 时 效应 的 总 和 … 。 协 同 药物 组 合 既 可 以 是 治 
疗 一 种 疾病 的 药物 组 合 , 如 治疗 艾滋 病 的 抗 病毒 组 合 ， 
也 可 以 是 治疗 多 种 疾病 的 药物 组 合 ,如 氮 毛 地平 阿 伐 
他 汀 片 ,该 药物 的 两 种 成 分 茶 磺 酸 氮 氯 地 平和 阿 伐 他 


学 的 发 展 不 断 趋 于 融合 ,结合 计算 与 网 络 生物 学 的 预 
测 方法 是 近年 来 的 研究 热点 。 例 如 ,J. Zou 等 提出 了 一 
个 基于 网 络 的 机 器 学 习 模 型 ,通过 整合 药物 - 药物 组 
合作 用 药物 - 葛 标 相 互 作用 和 驾 标 - 蛋白 相互 作用 ， 


汀 丐 ,前 者 用 于 治疗 高 血压 ,后 者 用 于 治疗 高 胆固醇 。 
协同 药物 组 合 是 在 中 西医 结合 背景 下 提出 的 , 既 能 体 
现 中 药 的 整体 协调 性 ,又 能 体现 西药 作用 机 制 靶 点 的 
明确 性 ” 。 在 临床 治疗 中 ,协同 药物 组 合 相 比 于 单一 
药物 具有 提高 疗效 .降低 毒 副作用 和 降低 抗 药性 等 优 
势 ”。 协 同 药物 组 合 来 源 于 对 大 量 随机 药物 组 合 进行 


重新 构建 药物 组 合 网 络 ,利用 网 络 拓扑 性 质 和 功能 : 

质 构 建 特征 向 量 ,采用 支持 向 量 机 工具 预测 协同 药物 
组 合 ”。S. Alaimo 等 通过 综合 表 型 结构 和 基因 组 相 
似 性 ,在 药物 相互 作用 网 络 的 基础 上 ,使 用 机 器 学 习 方 
法 进行 药物 相互 作用 预测 ”。K. Pang 等 开发 了 一 种 
算法 ,通过 从 Drugbank 数据 库 构建 药物 - 靶 点 相互 作 
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用 网 络 来 识别 协同 药物 组 合 , 利 用 药物 综合 相似 性 信 
息 来 预测 药物 相互 作用 中。 这 些 模型 以 已 有 研究 发 现 
为 理论 依据 , 即 药物 的 作用 机 理 越 相似 ,其 协同 作用 概 
率 越 大 。 但 这 些 研究 缺乏 对 疾病 并 发 症状 的 考虑 ,并 
发 症 即 为 共 发 生 率 高 的 疾病 ,治疗 并 发 症 是 研发 协同 
药物 组 合 的 主要 目的 之 一 ,因此 本 文 引入 文本 挖掘 和 
社会 网 络 方法 对 此 进行 改进 。 

链 路 预测 是 指 利用 已 知 网 络 信息 ,预测 网 络 中 目 
前 尚未 产生 连 边 的 两 个 节点 间 未 来 产生 连接 的 可 能 
性 7 。 该 方法 假设 两 个 节点 越 相似 ,它们 之 间 发 生 关 
系 的 可 能 性 就 越 高 ,就 越 容易 产生 连接 。 链 路 预测 广 
泛 应 用 于 蛋白 质 互 作 网 络 .代谢 网 络 .疾病 关联 网 络 
中 ,以 识别 相关 度 高 的 实体 。 因 其 广泛 适用 性 , 链 路 预 
测 蕊 在 计算 机 领域 .社交 网 络 和 生物 分 子 网 络 中 积累 
也 三 泛 的 研究 基础 和 成 果 ,特别 是 在 生物 分 子 网 络 中 ， 
SLR - 蛋白 质 相互 作 用 网 络 .代谢 网 络 和 食物 网 络 
等 生物 网 络 的 应 用 最 为 广泛 。 这 是 因为 在 实验 室 或 领 
域 捉 发 现 联系 或 相互 作用 的 代价 是 昂贵 的 ,而 高 精度 
的 预测 可 以 降低 实验 成 本 ,加 快 揭示 真相 的 速度 ” 。 
怀 且 白质 交互 网 络 为 例 ,由 于 蛋白 质 间 大 部 分 的 相互 
作用 依然 未 知 ,在 已 知 网 络 拓扑 结构 的 基础 上 提前 设 
讨 萝 确 的 链 路 预测 方法 ,有 利于 提高 实验 的 成 功率 并 
5 窑 实 验 消耗 成 本 。 例 如 , 贾 成 龙 提出 基于 网 络 模 
型 多 长 非 编码 RNA (Ine RNA) - 疾病 关联 预测 方法 ， 
HPA me RNA -疾病 关联 数据 Inc RNA 相似 性 网 络 和 
疾病 相似 性 网 络 从 而 得 到 Inc RNA - 疾病 异 质 网 络 ， 
然后 基于 链 路 预测 算法 ,对 Inc RNA 和 疾病 关联 关系 
进 生 预测 ""。 因 此 ,本 文 基于 链 路 预测 构建 协同 药物 
组 合 推 荐 模型 。 首 先 利 用 SAO( Subject-Action-Object) 
语义 挖掘 识别 出 医学 文献 中 的 并 发 疾病 信息 对 ,并 利 
用 数据 库 中 的 药物 信息 在 并 发 疾病 网 基础 上 构建 “ 疾 
病 -药物 - 靶 点 " 异 质 网 络 ,最 后 利用 链 路 预测 方法 评 
佑 不同 药物 作用 机 制 的 相似 性 ,预测 哪些 药物 组 合 更 
可 能 产生 协同 作用 。 为 验证 模型 的 有 效 性 ,本 文 以 肠 
道 疾 病 为 例 , 对 协同 药物 组 合 进行 了 预测 及 推荐 ,研究 
表明 该 推荐 模型 可 提供 筛选 实验 的 优先 级 ,进而 提高 
药物 组 合 的 研发 效率 。 


2 方法 框架 


本 文通 过 提取 医学 文献 中 的 SAO 语义 结构 构建 
并 发 疾病 网 络 ,基于 药物 数据 库 根 据 这 些 疾病 名 称 构 
建 “ 疾 病 - 药物 - 靶 点 "有 异 质 网 络 , 并 利用 链 路 预测 算 
法 评估 不 同 药物 间作 用 机 理 的 相似 度 ,预测 治疗 某 对 


并 发 症 或 单一 症状 的 潜在 协同 药物 组 合 ,为 药物 研发 
人 员 推 荐 药物 组 合 筛选 实验 的 优先 级 。 本 文 构建 协同 
药物 组 合 推荐 模型 的 具体 流程 如 图 1 所 示 : 
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1 协同 药物 组 合 推荐 模型 构建 流程 


2.1 数据 获取 与 预 处 理 

医学 文献 中 包含 大 量 疾病 间 关 联 信息 , 且 文 献 相 
比 电子 病 历 具 有 更 高 的 专业 性 ,因此 本 文 基于 PubMed 
医学 文献 数据 库 进行 并 发 症 挖 气 和 协同 药物 组 合 推 
荐 。 由 于 论文 核心 内 容 及 研究 成 果 一 般 出 现在 标题 或 
摘要 中 ,因此 本 文 首先 利用 Java 代码 进行 数据 抽取 , 仅 
保留 文献 标识 号 ,标题 和 摘要 等 信息 ,作为 后 续 并 发 症 
识别 的 数据 基础 。 
2.2 SAO 结构 提取 及 并 发 网 络 构建 
2.2.1 SAO 结构 提取 

SAO 是 一 种 从 文本 语 料 中 抽取 出 的 主 谓 宾 三 元 组 
结构 ”。 其 中 ,S 和 0 代表 系统 组 件 ,A 是 用 来 表达 
Subject 和 Object 间 关 系 的 动词 ”。SAO 语义 挖掘 党 
被 应 用 于 科技 情报 信息 提取 和 专利 相似 性 分 析 " 
等 。 由 于 该 方法 能 保证 两 个 关键 词 在 同一 句 话 中 , 故 
相 比 普通 的 关键 词 共 现 对 关联 关系 的 挖掘 具 有 更 高 的 
准确 性 ,对 医学 文本 信息 提取 更 具 价 值 。 而 Semrep 软 
件 拥 有 UMLS 的 超级 叙 词 表 .语义 网 络 和 专家 词典 的 
强大 功能 ,因此 提取 出 的 SAO 结构 拥有 医学 专业 
HE , 故 本 文 借助 Semrep 工具 提取 SAO 结构 ,其 表达 
示例 如 下 : 

23974065. ab. 1 | relation | C0014335 | Enteritis | dsyn | 
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dsyn | | | COEXISTS_WITH | C1290894 | Chronic disease of 
immune system | dsyn | dsyn | | 

FEH | “Enteritis” P“ Chronic disease of immune sys- 
tem” 是 从 摘要 第 一 句 话 中 提取 出 的 医学 实体 ，COEX- 
ISTS_WITH” 表示 这 两 个 词 之 间 的 语义 关系 为 “共存 ”， 
“dsyn” 表示 该 实体 为 “疾病 或 症状 ”。 由 于 本 文 旨 在 
识别 并 发 症 ,因此 仅 保 留 实体 语义 类 型 均 为 “dsyn” 的 
SAO 结构 。 
2.2.2 并 发 症 信 息 识别 

考虑 到 Semrep 软件 中 界定 的 语义 关系 中 “COM- 


PLICATES” “ ASSOCIATED _ WITH” “ CAUSES” “ AF 
FECTS” “ PREDISPOSES ” “ MANIFESTATION _ OF” 
“PRECEDES”“COEXISTS_WITH” 均 可 代表 疾病 间 具 
有 并 发 关系 "” ,因此 本 文 仅 筛选 包含 这 些 语义 关系 的 
SAO 结构 。 利 用 筛选 出 的 具有 并 发 关系 的 疾病 对 构建 
并 发 疾病 网 络 , 连 边 权 重 为 不 同 疾病 的 共 现 频次 ,并 利 
H VOSviewer 软件 形成 可 视 化 网 络 图 谱 , 根据 该 网 络 
则 可 以 探索 某 疾病 的 并 发 证 状况 ,具体 构建 流程 如 图 
2 所 示 : 


z7 


So sl AM 疾病 1 疾病 2 疾病 3 疾病 4 疾病 5 疾病 6 疾病 7 

S-0, RAL 。 疾病 3 aes SEES E o E E EE 

5 n 疾 if 中 Wg oo a og 0 

ei: oa al 疾病 3 1 0 0 1 0 0 0 

SO Am RMS > o o 1 o 0 o o 

y 5-0, 疾病 5 疾病 6 疾病 5 0 1 0 0 0 2 0 

> 5-0, ”疾病 6 疾病 7 疾病 6 0 0 o 0 2 0 1 

(Ce) S-O, ”疾病 6 ”疾病 5 Sa 0 o 0 0 0 1 1 
ral 图 2 并 发 疾病 网 络 构建 流程 


2@ 疾病 - 药物 - 靶 点 异 质 网 络 构建 

S 在 并 发 疾病 网 络 基础 上 ,为 进行 协同 药物 组 合 推 

荐 y 需 要 明确 每 个 疾病 对 应 的 药物 。CTD 医学 数据 库 

( Cdhparative Toxicogenomics Database ) 中 的 疾病 名 称 大 
AVF PubMed 文献 数据 库 , 因 此 选 其 作为 药物 查 

HRU A ROR CTD 医学 数据 库 与 PubMed 文献 疾 
称 不 匹配 的 问题 。 将 “疾病 - 药物 "对 应 关系 转 

化 狗 共 现 和 矩阵, 利用 VOSviewer 进行 可 视 化 ,构建 如 图 

3 接 示 的 “疾病 - 药物" 网络: 

= 


发 疾病 网 络 


3 疾病 -药物 网 络 示意 
以 往 的 药物 组 合 研究 通常 以 治疗 某 个 单独 疾病 为 
目的 ,如 疾病 1。 为 预测 协同 药物 组 合 , 则 需 对 所 有 能 


够 治疗 疾病 1 的 药物 进行 随机 组 合并 一 一 筛选 ,如 图 3 
中 的 三 种 药物 A.B`C。 考 虑 到 三 者 或 三 者 以 上 药物 配 
伍 使 用 的 机 理 较为 复杂 ,目前 的 药物 组 合 预测 研究 大 
多 以 两 种 药物 间 的 组 合 为 主 ,如 图 3 所 示例 的 疾病 1 
则 有 可 能 形成 三 种 随机 药物 组 合 :A+B、A+C、B+C， 
药物 组 合 预测 研究 则 主要 围绕 判定 这 三 个 组 合 中 哪些 
更 可 能 作为 协同 药物 组 合 展开 。 

由 于 研究 发 现 药 物 协 同 作用 概率 与 作用 机 理 相 似 
度 成 正比 ,因此 可 通过 评估 药物 作用 机 制 相似 度 来 
预测 协同 药物 组 合 。 有 学 者 研究 指出 ,药物 组 合作 用 
机 理 本 质 就 是 药物 靶 标 在 生物 系统 中 的 协同 调 
控 ”“”。 革 点 的 相关 性 在 很 大 程度 上 决定 药物 作用 
机 理 的 相似 性 , 即 评估 两 个 药物 能 否 形 成 协同 组 合 , 首 
先 需 要 判断 两 者 作用 靶 点 是 否 相 似 或 相关 。J. Zou 等 
通过 研究 协同 药物 组 合 及 其 网 络 拓扑 关系 发 现 协同 药 
物 组 合 靶 点 往往 存在 于 邻 域 ,瞄准 不 相关 的 靶 点 往往 
不 具有 协同 作用 所 B. Rita 等 研究 也 发 现 持 抗 作用 
几乎 均 发 生 在 靶 点 不 同 的 药物 之 间 , 协 同 作 用 更 多 发 
生 在 相同 节点 的 药物 中 ”" 。 因 此 本 文 以 靶 点 作为 药 
物 作用 机 理 的 特征 信息 , 即 用 药物 靶 点 相关 性 表征 作 
用 机 制 相似 性 ,进一步 判断 哪些 组 合 更 可 能 是 协同 药 
物 组 合 。 利 用 Drugbank 数据 库 查 找 药 物 的 靶 点 ,在 
“疾病 -药物 ”网 络 基 础 上 构建 “疾病 - 药物 - A” 
异 质 网 络 , 如 图 4 所 示 : 
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并 发 疾病 网 络 


4 疾病 -药物 - 靶 点 网 络 示意 


2.4 协同 药物 组 合 推荐 
2.4.1 链 路 预测 指标 选取 

在 疾病 - 药物 — 靶 点 异 质 网 络 中 的 药物 靶 点 作用 
网 络 基础 上 ,利用 链 路 预测 评估 药物 相似 性 。 基 于 网 
络 结构 信息 定义 的 相似 性 称 为 结构 相似 性 ,本 文选 取 
10 个 具有 代表 性 的 基于 结构 相似 性 的 链 路 预测 指标 
分 别 测度 网 络 , 表 1 列 出 了 这 些 指标 及 计算 公式 。 

应 用 上 述 指标 对 网 络 进 行 测度 ,可 以 计算 出 两 两 
节点 间 的 相似 度 ,每 对 节点 被 赋予 一 个 分 数值 。 不 同 
指标 计算 结果 不 同 ,为 此 还 需 评估 指标 的 测度 准确 性 。 
目前 对 网 络 结构 特征 和 算法 性 能 之 间 关 系 尚 未 开展 深 
入 研究 ,所 以 链 路 预测 均 通 过 准确 性 验证 来 选择 对 特 
定 网 络 预测 性 能 好 的 指标 。 


TT 

> R1 链 路 预测 指标 及 计算 公式 

| 指标 计算 公式 主要 变量 含义 

LO CN( 共 同 邻居 数 ) CNu=le(z)ne(y)1 92(x) 表 示 节 点 x 的 邻居 集合 
Dy ion (余弦 相似 度 ) g _le(z)ne()1 9()) 表 示 节 点 y 的 邻居 集合 
Ə a as hy A ky 分 别 表示 节点 xy 的 度 


SF yucoc _le(x) Ne(y) | 
© D lop(x) Ug(y) | 
fap) (Adamic-Adar 指标 ) 
o“ (优先 链接 指标 ) 
CN 局 部 路 径 指标 ) 


AA, = Drept ney) * 1/log k(z) 
PA, =k, * ky 


LP, = (A?) yy + a(A3) vy 
rout 全 局 路 径 指标 ) Katz, = È ER. | pathspaths\)) | 
=B4+B242+B343+… 
n(x,y) =M(L 和 -215 ) 


《ETC( 平 均 通勤 时 间 ) 
Cc 


aw 局 部 随机 游 走 ) ERW yy = qr * mey(t) +y * Tye) 


Q 全 加 的 局 部 随机 游 走 ) 


SRW, = E11 LRW,,(1) 


AUC 是 常用 的 准确 性 评估 指标 ,具体 评估 过 程 
如 下 :将 网 络 现 有 边 随 机 分 为 训练 集 和 测试 集 ,数据 集 
大 小 比例 为 9:1, 将 节点 间 尚 未 连接 的 边 称 为 不 存在 
的 边 ,如果 一 个 指标 的 计算 结果 中 能 尽量 使 测试 集 边 
的 分 数 大 于 不 存在 的 边 ,那么 其 预测 效果 越 好 。 按 照 
这 种 思想 ,每 次 随机 地 从 测试 集中 选 一 条 边 ,再 随机 选 
择 一 条 不 存在 的 边 ,比较 两 条 边 的 相似 度 分 值 。 若 测 
试 集 的 边 的 分 数值 大 于 不 存在 的 边 的 分 数 , 记 为 1 分 ; 
如 果 两 者 分 数 相等 , 记 为 0.5 分 ,和 否则 记 为 0 分 。 这 样 
独立 比较 na 次 , 设 有 mi 次 测试 集中 的 边 的 分 值 大 于 不 
存在 的 边 的 分 值 ,有 n, 次 两 分 数 相 等 , 则 AUC 定义 
为 : 


_n, +0.5n, 


AUC (1) 


A 表示 网 络 的 邻接 矩阵 ,(43) 表示 节点 x 和 节点 y 之 间 
长 度 为 3 的 路 径 数目 ,a 是 可 调 参数 
B 是 可 调 参 数 paths() 为 连接 节点 的 路 径 中 长 度 为 的 路 径 数 


态 为 矩阵 1+ 中 相应 位 置 的 元 素 


P 为 网 络 的 马尔 科 夫 概率 转移 矩阵 , 设 各 节点 的 初始 资源 分 布 为 9， 
即 点 x 的 度 占 网 络 中 全 部 连 边 的 比例 


将 AUC 值 最 大 指标 的 计算 结果 作为 药物 间 相 似 
度 值 。 由 此 可 见 , 链 路 预测 方法 是 从 众多 指标 中 筛选 
最 适合 特定 网 络 的 指标 进行 相似 度 计 算 。 以 往 药物 相 
似 性 计算 均 利 用 余弦 相似 度 进行 药物 的 靶 点 重合 度 测 
度 , 忽 略 了 药物 存在 不 相同 却 相 关 靶 点 的 情况 。 由 表 
1 可 知 链 路 预测 指标 本 身 包含 了 余弦 相似 度 指标 , 如 
果 在 预测 结果 中 余 强 相似 度 指标 的 AUC 准确 值 最 高 ， 
则 对 该 网 络 使 用 链 路 预测 与 余弦 相似 度 实际 为 同一 结 
果 ; 如 果 余 弦 相 似 度 指标 的 AUC 准确 值 不 是 最 高 , 则 
证 明 链 路 预测 方法 相对 于 余弦 相似 度 方法 更 适用 于 该 
网 络 。 

2.4.2 协同 药物 组 合 推荐 

基于 链 路 预测 结果 的 协同 药物 组 合 推荐 示意 如 图 

5 所 示 ,其 中 左 图 即 为 基于 药物 靶 点 作用 网 络 的 链 路 
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预测 结果 。 在 计算 结果 中 删除 相似 值 为 零 的 节点 连 
边 ,剩余 即 为 链 路 预测 新 产生 的 连 边 , 如 图 5 中 A 和 
EB 和 C、B 和 D 间 的 连 边 。 将 链 路 预测 结果 添加 到 


TT 
> 
© 图 5 
N 
LO 由 于 药物 组 合 是 在 中 西医 结合 背景 下 提出 的 ,中 
药 钱 身 即 为 治疗 多 种 并 发 症状 的 协同 药物 组 合 ,因此 
可 根据 中 药 的 配伍 过 程 进行 协同 药物 组 合 推荐 。 如 疾 
病 卫 和 疾病 2 是 一 对 并 发 症 , 则 治疗 这 对 并 发 症 的 药 
机 组 合 有 6 个 :A+DA+EB+D.B+E.C+D.C 
KE) 若 链 路 预测 结果 显示 在 药物 A 与 EB 与 D 之 间 
APE , , 则 其 为 协同 药物 组 合 的 概率 就 更 大 ,可 以 在 协 
同 药物 组 合 实 验 第 选 中 优先 验证 这 两 个 组 合 。 在 治疗 
上 人 疾病 时 ,如 前 文 所 述 治疗 疾病 1 的 三 种 药物 ,随机 
anny B 和 C 有 连 边 , 则 可 优先 验证 这 个 组 合 。 


3 实证 研究 
© 


考虑 到 肠 道 疾病 具有 和 较 强 复杂 性 ,对 并 发 症 治疗 
有 着 重要 需求 ,有 是 治疗 肠 道 疾病 的 药物 种 类 繁多 ,协同 
药物 组 合 筛选 存在 困难 ,因此 本 文 以 肠 道 疾病 为 例 验 
证 推荐 模型 有 效 性 。 在 PubMed 数据 库 以 (“intestinal 
diseases” [MeSH Terms] OR ( “intestinal” [ All Fields | 
AND “diseases” [ All Fields] ) OR “intestinal diseases” 
[ All Fields] ) AND (( “1900/01/01” [ PDAT ] ; “2019/ 
07/29” | PDAT]) AND “humans” [ MeSH Terms | AND 
English[ lang] ) 为 检索 式 , 检 出 并 下 载 肠 道 疾病 医学 文 
献 422 621 篇 (检索 时 间 为 2020 年 1 月 20 日 ) ,并 通过 
Java 代码 抽取 标题 .摘要 文献 标识 号 等 信息 。 

利用 Semrep 提取 出 SAO 结构 2 336 540 条 ,其 中 5S 
和 0 的 语义 类 型 均 为 “dsyn”( 表示 该 实体 为 “疾病 或 
症状 ” ) 的 SAO 结构 记录 共 14 426 条 。 为 挖掘 并 发 证 ， 
从 中 筛选 出 表征 并 发 疾病 关系 的 有 效 记 录 为 1 221 


“疾病 - 药物” 网络 中 ,如 图 5 的 右 侧 部 分 ,在 此 基础 


上 ,针对 每 一 种 疾病 或 者 每 一 对 并 发 症 ,都 可 以 给 出 推 
存 的 药物 组 合 实验 筛选 顺序 。 


条 ,将 其 转化 为 共 现 和 矩阵 并 输入 到 VOSviewer 软件 中 ， 
形成 如 图 6 所 示 的 并 发 疾病 网 络 图 : 


图 6 肠 道 疾病 的 并 发 疾病 网 络 


针对 其 中 共 现 频次 高 的 并 发 疾病 对 进行 分 析 ,发 
现 其 发 病 机 制 间 的 确 存 在 关联 ,如 隐 和 孢子 虫 病 和 艾 洲 
病 的 传播 途径 有 着 相似 之 处 ” ; 乳 糜 演 与 炎症 性 肠 病 
都 属于 自身 免疫 性 疾病 , 上 且 都 和 肠 道 菌 群 失调 有 
A” ,拥有 共同 的 易 感 基因 ; 克 罗 恩 病 会 导致 维 生 
素 k 水 平 降 低 ,而 骨 质 与 钙 的 结合 需要 维生素 K 的 作 
用 ,因此 克 罗 恩 病 患者 会 有 很 大 概率 只 患 骨 质 朴 松 。 
这 证 明基 于 SAO 语义 挖掘 的 并 发 症 识别 具有 效 性 。 

在 并 发 疾病 网 络 基 础 上 ,利用 CTD 医学 数据 库 根 
据 并 发 症 名 称 查 找 药物 ,构建 肠 部 疾病 的 “疾病 - 药 
物 ” 网 络 , 然 后 利用 Drugbank 数据 库 查 找 这 些 药物 的 
对 点 ,构建 “疾病 - 药物 - 靶 点 " 异 质 网 络 ,具体 如 图 
7.、 图 8 所 示 , 为 有 效 区 分 节点 类 别 ,在 图 中 以 中 括号 标 
识 疾 病 节点 。 
基于 其 中 的 药物 靶 点 作用 网 络 进行 药物 组 合 预 
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区 图 8 肠 道 疾病 -药物 ~ 靶 点 异 质 网 络 ( 局 部 ) 


e T E T E OE E 
测 指标 计算 节点 相似 性 以 及 AUC 指标 计算 均 通 过 Py- 
tho 语 语言 实现 ,算法 输入 为 网 络 所 有 节点 编号 及 网 络 
MAEN ,算法 输出 为 基于 各 种 指标 计算 得 到 的 节点 
半 柱 似 度 矩阵 以 及 每 一 个 指标 的 准确 度 AUC 值 ( 见 表 
DENR 2 可 以 看 出 ,Katz 指标 预测 效果 最 好 。 由 表 
1TA Katz 指标 考虑 了 网 络 中 的 全 部 路 径 ,包括 药物 
间 司 阶 以 上 共同 邻居 ;而 使 用 余弦 相似 度 方法 则 相当 
于 链 路 预测 里 的 Salton 指标 ,其 准确 度 低 于 0.5, 这 说 
明 对 于 药物 靶 点 作用 网 络 应 用 链 路 预测 方法 比 余弦 相 


似 度 效果 更 好 。 
表 2 链 路 预测 指标 AUC 值 
链 路 预测 指标 AUC 值 链 路 预测 指标 AUC 值 
Katz 0. 956 846 ATC 0. 898 134 
LP 0.923 104 Salton 0.483 125 
PA 0.919 334 CN 0.483 122 
SRW 0.918 104 Jaccard 0. 483 000 
LRW 0.917 472 AA 0. 482 945 


如 果 药 物 间 相似 度 为 0, 则 基本 可 以 认为 其 作用 
机 理 不 同 ,协同 作用 概率 极 低 , 则 删除 这 一 对 组 合 ,由 
此 根据 链 路 预测 结果 得 到 协同 药物 组 合 , 接 下 来 可 针 
对 具体 疾病 进行 协同 药物 组 合 推荐 。 例 如 ,有 18 种 治 
疗 子 宫 内 膜 蜡 位 的 药物 , 则 药物 的 随机 组 合 有 153 种 ， 


其 中 在 预测 结果 中 有 6 对 药物 产生 连 边 , 即 相似 度 不 
为 0。 这 6 对 药物 组 合 分 别 为 :Rofecoxib 与 Tibolone、 
Dinoprost 与 Sulindac , Danazol 与 Progesterone , Mifepris- 
tone 与 Tibolone Elagolix 与 Leuprolide ,Leuprolide 与 Su- 
lindac ,可 将 这 些 作 为 协同 药物 组 合 推荐 给 药物 研发 人 
员 进 行 优先 验证 ,以 期 有 效 降 低 研究 工作 量 。 为 验证 
模型 预测 结果 的 准确 性 ,本 文通 过 查找 药物 组 合 的 相 
关 资 料 进行 分 析 。 例 如 ,查找 治疗 子宫 内 膜 异 位 症 的 
相关 研究 发 现 ,Drugbank 数据 库 包 含 的 药物 相互 作用 
记录 显示 ,药物 对 “Rofecoxib”( 罗 非 背 布 ) 与 “Tibolo- 
ne” (PÈ) KHERA HEME , “Rofecoxib” 的 使 用 
RIHI“ Tibolone” ZRI PE ,而 这 个 药物 组 合 位 列 预测 
结果 第 一 位 。 男 外 ,“Lynestrenol 与 Simvastatin” “ Rofe- 


coxib 与 Simvastatin”“Zafirlukast 与 Naproxen”“ Celecox- 
ib 与 Progesterone” “ Ibuprofen 与 Elagolix” “Celecoxib 与 
Naproxen” “ Danazol 与 Mifepristone” “Ibuprofen 与 Simv- 
astatin ”等 药物 对 则 存在 明显 的 持 抗 效果 ,但 这 些 药 物 
对 均 不 包含 在 药物 组 合 预测 结果 中 。 

在 面向 并 发 证 治疗 时 ,同样 可 结合 预测 结果 进行 
协同 药物 组 合 推荐 。 例 如 ,由 图 6 FY Fl “ Cholangitis 
Sclerosing” ( 硬化 性 胆管 炎 ) 和 “Pancreatitis”( 胰腺 炎 ) 
是 并 发 程度 较 高 的 疾病 对 ,对 研发 协同 药物 组 合同 时 
治疗 两 种 症状 的 需求 较 高 。 而 治疗 硬化 性 胆管 炎 和 胰 
腺 炎 的 药物 随机 组 合 有 32 种 ,其 中 有 8 个 组 合 在 链 路 
预测 结果 中 产生 连 边 ,可 将 其 推荐 给 药物 研发 人 员 进 
行 优先 验证 。 同 样 ,我 们 通过 查找 相关 资料 发 现 ,美国 
在 2018 年 上 市 了 一 种 组 合 性 质 的 药物 “Festal Plus” , 
它 可 以 同时 减缓 硬化 性 胆管 炎 和 胰腺 炎 两 种 疾病 ,该 
药物 的 主要 成 分 为 Ursodeoxycholic acid ( 能 去 氧 胆 酸 ) 
和 Pancrelipase( 胰 脂 酶 ) ,前 者 主要 用 于 治疗 胆管 炎 ， 
后 者 可 用 于 治疗 因 守 性 纤维 化 ,慢性 胰腺 炎 引 起 的 胰 
腺 功能 不 全 。 这 证 明 同 时 使 用 Ursodeoxycholic acid 和 
Pancrelipase 可 以 产生 协同 作用 , 且 已 被 研发 成 为 组 合 
药物 ,而 能 去 氧 胆 酸 与 胰 脂 酶 包含 在 链 路 预测 结果 中 ， 
这 说 明 本 文 构建 的 协同 药物 组 合 推 荐 模型 可 以 给 予 具 
有 协同 效应 的 药物 对 更 高 的 优先 级 , 即 协同 药物 组 合 
推荐 模型 具有 有 效 性 。 


4 结语 


科技 部 生物 中 心 在 介绍 新 冠 肺炎 药物 疫苗 研发 新 
情况 时 强调 ,科研 攻关 组 在 药物 研发 过 程 中 要 遵循 老 
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药 新 用 的 研发 策略 。 协 同 药物 组 合 符合 老 药 新 用 的 
药 策略 , 且 于 临床 治疗 有 着 多 种 优势 ,尤其 针对 复杂 疾 
病 的 治疗 ,更 有 降低 并 发 症 患者 用 药 复杂 性 的 优势 , 设 
计 有 效 预 测 方法 提高 药物 组 合 筛选 的 效率 尤为 重要 。 
本 文 借助 网 络 生物 学 思想 ,结合 数学 模型 和 计算 机 技 
术 , 利 用 SAO 语义 挖 气 技 术 和 社会 网 络 分 析 方 法 从 并 
发 症 诊疗 视角 出 发 ,构建 了 以 靶 点 表征 药物 作用 机 理 
的 协同 药物 组 合 预测 框架 ,并 引入 链 路 预测 方法 对 药 
物 相似 度 计算 做 出 改进 ,有 效 弥 补 了 以 往 研究 中 忽略 
药物 具有 不 相同 但 相关 纲 点 的 情况 ,实证 研究 发 现 对 
于 药物 靶 点 作用 网 络 , 链 路 预测 算法 相 比 余弦 相似 度 
具有 更 高 的 准确 性 。 同 时 ,通过 查找 相关 医学 资料 , 验 
正 了 部 分 预测 结果 ,说明 本 文 模型 具有 有 效 性 和 实用 
隆 > 省 助 于 为 推荐 给 药物 研发 人 员 进 行 协同 药物 组 合 
佐 多 验证 提供 保障 ,从 而 有 效 降低 研究 者 工作 量 。 
LO 本 文 研究 不 足 之 处 在 于 : 受 学 科 专 业 限制 , 尚 无 法 
通过 医学 实验 全 面 验证 模型 所 有 预测 结果 的 准确 性 ， 
但 巧 通过 现 有 资料 验证 了 部 分 预测 结果 的 准确 性 。 同 
时 订 文 仅 使 用 靶 点 信息 度量 药物 相似 性 ,药物 作用 机 
名 伪 息 相对 单一 ,未 来 可 尝试 利用 多 维 信息 ( 比如 药物 
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Abstract: | Purpose/significance | Compared with single drug, drug combination has many advantages in clini- 


cal treatment. But the growth of drug quantity brings difficulties to drug combination screening experiment. There- 


Re , it is of great significance to design an effective prediction method to recommend drug combination which is more 


UiRely to produce synergistic effect for pharmaceutical staff, so as to improve the screening efficiency. | Method/ 


@5ocess | For the need of concurrent diseases treatment, proposed a drug combination recommendation model based 


on link prediction, and used the SAO semantic mining to identify the complications in medical literature. On this ba- 


Ga, we used the medical database to build the heterogeneous “ disease-drug-target” network, and introduced link 


@rediction to evaluate the similarity of drug action mechanism, and predicted which drug combinations were more 


Qaely to have synergistic effect. Based on the prediction results, recommended a combination of drugs for a certain 


disease or a pair of complications. | Result/conclusion | The empirical analysis of intestinal disease data verified the 


=practicality and efficiency of the model. 


© Keywords: SAO semantic mining link prediction social network analysis drug combination recommendation 


(“disease complications 
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